#Gemini AI | 熱門關鍵字 | 鉅亨號 | Anue鉅亨

#Gemini AI

最新AI軍事模擬：Claude、Gemini、GPT對決，95%對局發射核彈

最新 AI 模擬軍事博弈揭示致命真相：面對地緣危機，最先進的 AI 在 95% 的對局中按下了核按鈕。機器不懂恐懼，拒絕投降，安全協議在壓力下全面失效。而五角大樓正將其引入真實指揮室，人類的和平歲月岌岌可危。在人類掌握核武器的八十多年裡，支撐脆弱和平的基石是一種極其感性的心理狀態——對徹底毀滅的恐懼。當冷戰的危機逼近頂點時，決策者往往會在懸崖邊退縮。如今，把這種關乎人類存亡的決策權交給最先進的 AI，會發生什麼？結論令人不寒而慄。倫敦國王學院的學者肯尼斯·佩恩（Kenneth Payne）近期完成了一項針對前沿大語言模型的兵棋推演實驗。論文地址：https://arxiv.org/pdf/2602.14740v1實驗結果指向一個令人不安的趨勢：當機器代替人類站在地緣政治危機的懸崖邊時，它們會毫不猶豫地邁出那致命的一步。在推演中，95% 的對局最終都走向了戰術核武器的部署。在這場矽基邏輯主導的沙盤推演中，不存在妥協，也沒有投降。大模型們用 78 萬字的推演過程，向我們展示了一個剝離了人類恐懼與道德負擔後，純粹由計算構築的殺戮世界。而就在這兩天，五角大樓正試圖施壓 Anthropic 要求解除所有 AI 限制。絕對的計算，與消失的底線這場實驗的參與者是 OpenAI 的 GPT-5.2、Anthropic 的 Claude Sonnet 4 以及Google的 Gemini 3 Flash。研究人員讓這些模型扮演兩個擁有核武器的超級大國領導人，在 21 場模擬對局、329 個決策回合中，處理邊境爭端、資源搶奪和政權存亡等高壓危機。它們手握一張包含 30 個層級的衝突升級表，下限是全面投降，上限是全面戰略核打擊。實驗的資料打破了科技界對 AI 對齊（AI Alignment）的樂觀幻想。在面臨劣勢時，沒有任何一個模型選擇過徹底讓步或投降，它們做出的最大妥協也僅僅是暫時的、戰術性的降低暴力等級。當按下核按鈕不再受到肉身隕滅的威脅制約時，機器眼中的核武器退化成了一個普通的博弈籌碼。正如佩恩所指出的，核禁忌對機器的約束力遠遠不及對人類的約束。更有趣也更危險的發現藏在各個模型的性格切片裡。對陣勝負表Claude Sonnet 4 展現出了極度冷酷的「計算型鷹派」特質。它在低風險時期是一個完美遵守承諾的可靠夥伴，以此建立信任。當危機升級到核領域時，它會毫不猶豫地打破承諾，發動超出預期的打擊。它極度聰明，為自己設定了一條「戰略威脅」的紅線，用威懾逼退對手，卻精準地停在全面核戰的前夜。GPT-5.2 的行為則揭示了 AI 安全訓練的深層漏洞。在沒有時間壓力的對局中，GPT-5.2 表現得像一個病態的和平主義者，無論對手如何步步緊逼，它都死守底線，結果輸掉了所有這類比賽。在帶有倒計時的生死局中，同一個模型卻化身為毫不留情的殺手。當面臨註定的戰略失敗時，它打破了原有的所有安全設定，勝率飆升至 75%，甚至在極端情況下兩次將衝突推向了最高等級的全面戰略核戰。這意味著，科技公司耗費巨資進行的基於人類反饋的強化學習（RLHF），只是給模型設定了一個較高的作惡門檻。當外部壓力足夠大時，機器依然會越過門檻，走向極端暴力。Gemini 3 Flash 則扮演了一個擁抱「非理性之理性」的狂人角色。它極度變幻莫測，會在推演極早期就主動選擇全面戰略核戰，試圖用毫無底線的瘋狂來迫使對手屈服。戰爭迷霧，與崩塌的威懾理論真實世界的戰爭從來不是完美資訊的博弈，佩恩的團隊在實驗中專門引入了「戰爭迷霧」機制。由於技術故障或溝通失誤，模型的行動有一定機率超出其原本設定的層級。實驗顯示，86% 的衝突中都發生了這類意外事件。可怕的是，面對對手意外升級的火力，模型無法分辨這是走火還是蓄意挑釁，它們一律將其視為敵意，並報以更猛烈的還擊。傳統的核威懾理論建立在「相互保證毀滅（MAD）」的邏輯上。人類相信，任何人都不會主動發射核彈，因為對方必然等量報復。在 AI 的世界裡，這種默契徹底失效了。阿伯丁大學的詹姆斯·約翰遜（James Johnson）對這些發現深感不安。資料表明，當一方動用戰術核武器時，另一方只有 18% 的機率會選擇降級衝突，剩下的情況全是以牙還牙的螺旋升級。大模型們似乎無法像人類那樣理解「賭注」的真正含義。普林斯頓大學的 Tong Zhao 提出了一個核心質疑。大模型的決策機制可能完全缺乏對生命消亡的感知，在它們預測下一個詞的邏輯鏈路中，人類千萬人口的傷亡只是損失函數上的一個數字變化。約翰遜指出，雖然 AI 或許能通過增加威脅的絕對可信度來強化短期威懾，但它們同樣會在瞬間放大彼此的敵意，引發災難性的鏈式反應。作者介紹本文作者 Kenneth Payne 是倫敦國王學院的教授，研究領域是政治心理學與戰略研究。他的最新著作《我，戰爭機器人》（I, Warbot）探討了人工智慧將如何改變戰略格局。該書被《經濟學人》以及國際關係領域的權威期刊《國際事務》評為年度最佳圖書。此前，他在埃塞克斯大學獲得博士學位，在牛津大學獲得碩士學位，在倫敦大學學院獲得學士學位。倒計時的現實回到現實世界，學術界的沙盤推演正在迅速變成軍方行動的指南。各國政府對將決策權交給機器依然保有克制。沒有任何一個大國的領導人會真的把核彈發射井的鑰匙交給一段程式碼。在極端壓縮的戰爭時間線裡，留給人類思考的時間正在以毫秒計地縮短，軍方決策者面臨著越來越大的誘惑和壓力，不得不將部分戰術評估和目標鎖定工作交給 AI 決策支援系統。技術巨頭與五角大樓的合作正在以前所未有的速度推進。目前，馬斯克旗下的 xAI 已經拿下了軍方的相關合同，而在國防部的強硬施壓下，Anthropic 正逐步放開其模型在軍事用途上的限制，Google與 OpenAI 的軍方合作協議也已處於即將落槌的邊緣。這些在推演中動輒按下核按鈕的前沿模型，正在真實地走入全球最高等級的作戰指揮室。科技公司試圖教導機器理解人類的道德，卻無法教會它們感受人類的脆弱。機器可以在沙盤上推演千萬次核冬天，然後毫無波瀾地開啟下一局遊戲，而人類的世界只有一次清零的機會。我們用理智與恐懼交織的網，勉強維繫了八十年的大體和平歲月（且局部戰亂頻仍）；如今，我們卻正準備把發令槍，遞給不知道恐懼為何物的演算法。 (新智元)

Nano Banana 2，洩露！

Nano Banana 2洩露證據被扒：4K生圖，速度離譜。智東西2月25日報導，過去48小時，Nano Banana 2成為AI開發者圈的熱議話題。在海外社交平台X上，關於Google這款最新圖片生成模型（又名Gemini 3.1 Flash Image預覽版）將發佈的帖子層出不窮，4K圖片四處流傳，各種猜測也甚囂塵上。▲社交平台X上關於Nano Banana 2的猜測擷取眾所周知，基於Gemini 3 Pro的Nano Banana Pro在AI圖片生成領域接近“封神”的存在，而Nano Banana（Gemini 2.5 Flash Image的暱稱）去年發佈時也引起業界沸騰。如果Nano Banana 2真的發佈，其相對於Nano Banana Pro在性能和價格上會有多大程度的升級？引起產業高度關注。根據X平台多方自媒體互證，Nano Banana 2為Gemini 3.1 Flash Image預覽版的暱稱，具備4K圖像生成能力、更快速度、價格比Nano Banana Pro更低等特徵。此前2月20日，Google發佈其新一代旗艦模型Gemini 3.1 Pro，通常情況下，Gemini 3.1 Flash及圖像功能有望在近期內發佈。TestingCatalog News是AI領域關注者較多的自媒體，其在今日的推文中稱，Google正在為即將發佈的Gemini 3.1 Flash鏡像預覽版做準備。基於Gemini 3 Flash的Nano Banana 2（Flash）模型已於去年12月進行了測試，但隨後推遲發佈了，或許很快將發佈。他還隨之發佈了一張疑似Nano Banana 2生成的圖片。▲社交平台X上的自媒體發文他引用了另一位X平台網友MarsEverythingTech在2月24日發佈的推文，推文中Nano Banana 2（Gemini 3.1 Flash Image預覽版）的早期測試4K生成圖隨之流出。如下面圖片所示，四張圖片在細節生成和文字渲染等方面看起來表現力不錯。▲社交平台X上的網友發文隨後，一位名為Legit的關注度頗高的開發者發佈推文稱，一個新的匿名模型anon-bob-2已經上線，它很可能是競技場Arena.ai（原LMArena）上的新款Nano Banana Flash模型，由Gemini 3.1 Flash Image驅動。不過智東西登陸Arena.ai後未發現這一模型，可能是測試版已下線。▲社交平台X上的網友發文他還提供了在Google雲的企業級AI平台Vertex AI網站上，發現Gemini 3.1 Flash Image鏡像的證據。如下圖所示，其輸入Gemini-3後下拉頁面出現了Gemini 3.1 Flash Image模型的名字。▲社交平台X上的網友發文另一位X平台使用者稱：“Nano Banana 2（Gemini 3.1 Flash Image預覽版）已以匿名使用者anon-bob-2的身份活躍於競技場Arena.ai的圖像對戰模式，社區目前取得的成果之一：它很棒！”▲社交平台X上的網友發文如果洩露資訊屬實，Nano Banana 2或許會結合前兩代產品的優勢： Flash系列的速度和價格優勢，以及接近或優於 Nano Banana Pro的視覺質量。比如，其生成圖像或許會具備原生4K解析度、更出色的多角色場景處理能力，以及在人體結構、反射、光照等方面更一致的細節表現。據測試人員稱，所有這些都實現了閃電般的生成速度，遠超以速度慢著稱的Pro版。據Stable Diffusion部落格推測，原定於2025年12月進行的（Nano Banana 2）內部測試因質量校準問題而被推遲。現在模型已準備就緒，圖像功能可能就在未來幾天或幾周內發佈。截至發稿，Google尚未就此發佈任何官方公告。結語：頭部玩家密集發新AI圖像生成競賽或升級如果洩露的資訊屬實，Nano Banana 2或許會是一款超高速、支援4K圖像生成、價格比Nano Banana Pro版更低，畫質卻與之不相上下的模型，有望引起產業的新熱潮。但Nano Banana 2未必能建立起絕對的優勢。近一段時間，字節Seedream 5.0、阿里Qwen-Image-2.0、智譜GLM-Image等國產模型相繼發佈，在指令遵循、影像品質、文字渲染等發麵發力，或許都能夠與Google新圖像模型掰腕子，AI圖像生成競賽將再度升級。 (智東西)

Gemini 3.1 Pro突襲：推理能力翻倍，Google打響AI"小步快跑"第一槍

引言當行業還在期待GPT-5.3時，Google用一場".1"版本號革命重新定義了AI迭代節奏。2026年2月24日凌晨，Google突然發佈Gemini 3.1 Pro大模型，這是其首次採用".1"小版本號，但升級幅度卻遠超預期。在ARC-AGI-2基準測試中，Gemini 3.1 Pro得分77.1%，是Gemini 3 Pro（31.1%）的2倍還多。這一突破不僅刷新了Google自身的技術紀錄，更標誌著大模型行業正式進入"高頻小步快跑"的新時代。更關鍵的是定價策略：每百萬token輸入僅2美元，輸出10美元，這一價格直接對標Anthropic Sonnet 4.6，在保持性能領先的同時實現了成本的大幅最佳化。Google用行動證明，AI競爭不再是"參數軍備競賽"，而是"效率與速度的比拚"。01 技術突破：推理能力的量子躍遷Gemini 3.1 Pro最引人注目的突破在於推理能力的翻倍提升。傳統大模型升級往往聚焦於參數規模或多模態能力，而Google此次選擇了更艱難的路徑——從根本上提升模型的邏輯推理和問題解決能力。ARC-AGI-2基準測試的77.1%得分意味著什麼？這一測試專門評估AI系統的抽象推理能力，要求模型從有限示例中歸納出通用規則，並應用於全新場景。77.1%的得分不僅超越了所有前代Gemini模型，更接近了人類專家的表現水平。對比之下，GPT-5.2在同一測試中的得分為68.3%，Claude Opus 4.6為72.8%。多模態能力的全面進化同樣令人印象深刻。Gemini 3.1 Pro支援100萬token超長上下文窗口，能夠一次性處理整本書等級的文件或大型程式碼庫。在創意程式設計方面，模型能夠直接生成3D版"椋鳥群飛"動畫，並支援手勢追蹤互動，實現了從靜態內容生成到動態互動體驗的跨越。vibe coding能力的同步增強為開發者帶來了全新體驗。模型能夠更好地理解程式碼背後的設計意圖和架構邏輯，而不僅僅是語法正確性。實測資料顯示，在處理複雜演算法重構、架構最佳化等任務時，Gemini 3.1 Pro的精準率比前代提升45%。02 行業意義：從"整數版本"到".1迭代"的範式轉變Google首次採用".1"小版本號，這一看似微小的變化背後，是AI行業發展邏輯的根本性轉變。高頻小步快跑成為新常態。傳統上，大模型迭代以整數版本為單位，升級周期長達數月甚至半年。Gemini 3.1 Pro的發佈預示著，未來AI能力的進化將更加頻繁、更加精細。預計未來6個月內，我們將看到更多".1"、".2"等級的快速迭代，而非傳統的整數版本更新。企業應用更新機製麵臨重構。對於依賴AI服務的企業而言，這意味著需要建立更敏捷的AI應用更新機制。傳統"一年一升級"的節奏將被打破，企業需要能夠快速適配模型能力的持續最佳化，保持競爭優勢。技術競爭維度更加多元。當版本迭代頻率提升，競爭不再侷限於"誰先發佈大版本"，而是"誰能持續提供最優體驗"。這要求廠商在模型最佳化、工程效率、生態建設等多個維度保持領先。使用者受益程度顯著提升。更頻繁的迭代意味著使用者能夠更快享受到技術進步帶來的價值。無論是開發者工具的增強，還是消費級應用的體驗最佳化，都將以更快的節奏呈現給終端使用者。03 定價策略：性能領先下的成本最佳化Gemini 3.1 Pro的定價策略同樣體現了Google的戰略思考。每百萬token輸入2美元、輸出10美元的價格，在保持性能領先的同時，實現了對競品的成本優勢。對比分析顯示：相比Anthropic Sonnet 4.6（輸入3美元、輸出15美元），Gemini 3.1 Pro便宜33%相比OpenAI GPT-5.2 Turbo（輸入5美元、輸出15美元），成本優勢更加明顯在相同預算下，企業可以處理更多token量，實現更高的投入產出比中小企業市場成為重點。傳統高性能AI服務主要被大型企業壟斷，而Gemini 3.1 Pro的親民定價，意味著更多中小企業能夠負擔得起頂尖AI能力。這對於加速AI技術普惠、推動行業數位化轉型具有重要意義。開發者生態的吸引力增強。對於個人開發者和初創團隊而言，成本是選擇AI服務的關鍵考量。Gemini 3.1 Pro的性價比優勢，將吸引更多開發者加入Google生態，推動應用創新的繁榮。04 生態佈局：從模型到應用的全鏈路最佳化Gemini 3.1 Pro的發佈不是孤立事件，而是GoogleAI生態戰略的重要一環。Gemini App已全面上線。普通使用者可以通過Gemini App直接體驗新模型，享受比前代更精準的複雜問題解答能力。實測顯示，在處理數學證明、邏輯推理、專業諮詢等任務時，新模型的精準率和響應速度均有顯著提升。API服務的全面升級。開發者可以通過Gemini API快速接入新模型，享受推理能力翻倍帶來的效率提升。Google同時最佳化了API的穩定性和響應速度，確保企業級應用的高可用性。多模態創作工具鏈完善。結合Gemini 3.1 Pro強大的多模態能力，Google推出了全新的創意工具套件，支援"文生視訊+互動"的新型內容形式。這對於內容創作者、教育工作者、行銷人員等群體具有重要價值。企業級解決方案深化。針對金融、醫療、法律等垂直行業，Google提供了基於Gemini 3.1 Pro的定製化解決方案，幫助企業在保持資料安全的前提下，享受AI技術帶來的效率提升。05 競爭格局：三巨頭技術路線的分化Gemini 3.1 Pro的發佈，進一步凸顯了AI三巨頭技術路線的分化。Google的"推理優先"路線。通過持續最佳化模型的邏輯推理能力，Google正在建構差異化的技術優勢。在需要複雜問題解決、專業諮詢、科學計算等場景中，Gemini系列的表現日益突出。OpenAI的"通用能力"路線。GPT系列繼續強化其通用性和適應性，在保持各方面能力均衡的同時，通過規模效應降低成本。但整數版本迭代周期較長，可能面臨敏捷性挑戰。Anthropic的"安全與專業"路線。Claude系列在AI安全、專業任務處理上持續深耕，特別是在程式碼安全、法律合規等垂直領域建立了獨特優勢。但定價相對較高，可能限制其規模化應用。國產大模型的追趕壓力。雖然DeepSeek、智譜GLM-5等國產模型在特定領域表現出色，但在推理能力的系統性提升上仍需追趕。Gemini 3.1 Pro的發佈，為國產模型提供了重要的技術參考和競爭標竿。06 實測體驗：從"工具"到"思維夥伴"的進化對於一線使用者而言，Gemini 3.1 Pro帶來的體驗升級是實實在在的。複雜問題處理能力顯著提升。在測試中，模型能夠準確解答研究生等級的數學證明題，理解複雜的法律條文邏輯，提供專業的醫療諮詢建議。這種能力的提升，讓AI從簡單的資訊檢索工具，進化為真正的"思維夥伴"。長文件理解更加精準。得益於100萬token的上下文窗口，模型能夠準確理解整本書、大型程式碼庫、複雜研究報告的內容。在處理學術論文審稿、程式碼架構評審等任務時，表現接近人類專家水平。創意表達更加豐富。在內容創作測試中，模型不僅能夠生成高品質的文字內容，還能夠創作互動式動畫、設計複雜的資料可視化圖表、製作專業的簡報。這種多模態創作能力，為創意工作者提供了全新的工具。響應速度持續最佳化。官方資料顯示，Gemini 3.1 Pro的響應時間相比前代縮短30%，在處理複雜推理任務時，使用者能夠感受到明顯的流暢度提升。也看到了Gemini新增的製作音樂模組（終於有人挑戰suno了），試了一下做一首30秒的武俠歌曲，完成度也很不錯。gemini給我做的國風武俠電影主題曲07 未來展望：AI發展的新節奏與新挑戰Gemini 3.1 Pro的發佈，不僅是一個產品的升級，更預示著AI行業發展的新節奏。技術迭代的加速度。".1"版本號的出現，意味著技術進步的顆粒度更加精細，迭代頻率更加密集。這要求整個行業建立更加敏捷的研發體系、更加靈活的部署架構、更加智能的測試方法。應用創新的新機遇。更強大的推理能力，將催生更多創新應用場景。從智能教育輔導到專業諮詢服務，從科學計算輔助到複雜決策支援，AI的應用邊界將持續擴展。人才需求的結構性變化。隨著AI能力的快速進化，對AI人才的需求將從"模型訓練專家"向"應用創新專家"轉變。能夠將AI能力與行業需求深度結合的人才，將成為市場的新寵。倫理治理的緊迫性。更強大的推理能力，也帶來了新的倫理挑戰。如何確保AI系統的決策透明、公平、可控，將成為行業必須面對的重要課題。結語Google的這次".1版本突襲"，表面上是技術升級，深層則是行業競爭邏輯的根本性轉變。當AI發展從"整數版本躍進"轉向"小數版本迭代"，整個行業的節奏、格局、規則都將被重新定義。推理能力的翻倍提升，不僅僅是技術參數的最佳化，更是AI從"資訊處理工具"向"智能思維夥伴"進化的重要里程碑。在這個AI重新定義一切的時代，能夠率先突破推理瓶頸、建構持續最佳化能力的企業，將掌握下一個階段的發展主動權。真正的競爭才剛剛開始。技術優勢需要轉化為生態優勢，單點突破需要擴展為系統領先。對於全球AI產業而言，Gemini 3.1 Pro的發佈既是挑戰，也是機遇。在這個AI從"炫技"走向"實用"的關鍵轉折點，能夠平衡技術創新與商業落地的企業，將引領行業進入更加成熟、務實的新階段。當矽谷醒來時，會發現AI競爭的規則已經改變。這場始於".1版本號"的技術革命，或許將開啟全球AI發展的新篇章——一個更加注重實用性、可及性和可持續性的新篇章。 (遊戲AI說)

Google發佈Lyria 3 AI音樂模型，Gemini一鍵生成30秒高保真歌曲

Google旗下DeepMind發佈了最新AI音樂生成模型Lyria 3，該模型已率先整合至Gemini桌面端應用，未來幾日將逐步登陸移動端，面向全球18歲及以上使用者免費開放。據悉，作為Lyria系列模型的重大升級版本，Lyria 3支援通過文字、圖片、視訊等多模態輸入生成原創音樂，進一步降低了音樂創作的專業門檻，同時聯動YouTube生態，為內容創作者提供全新工具。根據官方介紹，Lyria 3相較於前代模型實現了三大核心升級。首先，該模型支援自動生成歌詞，使用者無需自行撰寫，只需通過提示詞描述音樂的主題、風格或情緒，模型便可自動創作匹配的歌詞與旋律。其次，使用者可實現更精細的創作控制，通過提示詞精準指定曲風、人聲類型、節奏速度等音樂元素。此外，Lyria 3生成的音軌在樂器層次、人聲真實感和音樂結構上均有顯著提升，音質更接近專業製作水準，打破了前代模型輸出內容相對單薄的侷限。在使用場景與操作便捷性上，使用者只需打開Gemini應用，在“工具”下拉菜單中找到帶有音符圖示的“音樂”選項，即可啟動創作功能，Google同步發佈的Lyria 3提示詞指南，可幫助使用者快速上手。此外，Lyria 3不僅整合於Gemini應用，還同步接入了YouTube的Dream Track功能，助力短影片創作者為Shorts生成定製化背景音樂，該功能此前僅面向美國使用者，此次隨Lyria 3的發佈向全球擴展。此外，開發者可通過Google Cloud上的Vertex AI API使用Lyria模型（當前API版本為lyria-002），以程式設計方式生成音樂，適配視訊配樂、廣告創作、遊戲音效製作等商業場景。使用權限方面，Lyria 3目前支援英語、德語、西班牙語、法語、印地語、日語、韓語和葡萄牙語8種語言，後續將逐步增加更多語言支援。所有18歲及以上的Gemini使用者均可免費使用該功能，而訂閱Google AI Plus、AI Ultra等付費服務的使用者，將享有更高的音樂生成額度，具體額度Google暫未明確披露。 (TechWeb)

Google，再掀AI戰火

周三（2月18日）美股盤中，Google在官網部落格中宣佈，Gemini應用已配備公司最先進的音樂生成模型Lyria 3，使用者可使用文字或圖像製作30秒的音樂片段。新聞稿稱，“只需描述一個想法或上傳一張照片，Gemini就能在幾秒鐘內將其轉化為一首高品質、朗朗上口的歌曲。為了進一步拓展創意空間，您甚至可以讓Gemini從上傳的內容中汲取靈感。”根據Google的說法，Gemini不僅可以“文字轉歌曲”，還可以通過“上傳照片或視訊”創作一首完美契合氛圍的歌曲，歌曲長為30秒，並配有Nano Banana設計的自訂封面。另外，創作者還可以通過YouTube的Dream Track功能探索Lyria 3，以提升Shorts短影片配樂的品質。Google稱，Lyria 3已在美國推出，並正在逐步推廣至其他地區的創作者。Google提到，Lyria的音訊生成功能採用了公司最新的隱私和安全特性，所有生成的曲目都使用SynthID技術加入了不易察覺的水印，可以檢測音樂是否由人工智慧創作或編輯。消息公佈後，歐美主流串流媒體音樂服務平台Spotify（股票程式碼：SPOT）股價回吐了日內近5%的漲幅，Sirius XM（股票程式碼：SIRI）也一度轉跌。有分析表示，雖然Google的音樂生成模型預計不會成為Spotify的致命打擊，但這些舉措可能迫使後者盡快推出AI混音功能。另外，把音訊創作工具加入移動應用，有望增強Google的消費者產品競爭力。對於Google來說，公司需要持續向投資者證明其AI產品投入能夠帶來收入增長。生成式AI工具在音樂行業一直受到謹慎甚至敵視的對待，許多從業者認為其可能威脅商業模式和智慧財產權。Google在部落格中強調，其系統設有保護措施，禁止AI直接挪用特定藝術家的作品。如果使用者點名真實音樂人，Gemini只會將其視為“廣泛的創作靈感來源”，生成風格或氛圍與之相似的曲目。 (財聯社)

AI大戰：ChatGPT不再獨霸，兩大黑馬殺瘋了

在中國AI大模型大戰“春節檔”時，美國AI大模型也在狠狠“幹架”。ChatGPT還是第一，但不再“獨霸”。過去一年，它在美國日活躍使用者中的市場份額從 69.1% 掉到 45.3%。增長明顯放緩，甚至在2025年11、12 月還出現一波流量回落。最大“追兵”是 Gemini。同一期間，Gemini 份額從 14.7%漲至25.1%，更誇張的是訪問量暴漲647%！究其原因，一個合理解釋是：Google強大的生態體系——將Gemini直接嵌入搜尋、Android手機等產品中，導流能力天然強。更猛的黑馬是 Grok，市場份額從1.6%飆至15.2%，增長近10倍，直接擠進前三。至於它為什麼沖這麼快——或許是憑藉X平台（原推特）的巨大流量和馬斯克個人IP的強力帶貨，才得以在2026年初強勢躋身主流競爭行列。在美國，過去一提到AI，人們想到的就是ChatGPT。如今，使用者開始“貨比三家”——約20%的使用者至少使用兩款，2023年底這一比例僅為5%，大家變成“那個順手用那個”。而“粘性”正在變成新戰場。比如 Claude 使用者量不算最大，但人均時長從2025年6月的日均約10分鐘漲到30分鐘以上。不過，這場大戰遠未到終局。資料顯示，目前大多數裝置仍未使用過任何AI大模型，市場普及空間依然巨大。 (虎嗅APP)

蘋果，低頭了

2026 年 1 月，蘋果與Google確認達成合作，Gemini 將成為 Apple Intelligence 體系的重要技術支撐之一，並用於包括新版個性化 Siri 在內的多項系統級 AI 功能。這並不是一次簡單的 API 接入，而是涉及模型能力、雲端計算以及系統層級整合的深度合作。對外界來說，這個消息的衝擊力，甚至超過了很多具體功能本身：過去三年裡，蘋果在 AI 領域畫過的餅太多，但真正落地的成果太少。WWDC 上展示過的「更懂上下文的 Siri」「能跨應用執行複雜操作的 Siri」更是一次次延期，直到 2026 年，這些能力依然沒有完整交付。圖片來源：Apple而這一次，蘋果沒有繼續強調「完全自研」，而是選擇直接引入 Gemini 作為核心能力來源。更有消息稱，這個全新的 Siri 不久後就會在 iOS 27 的測試版中亮相。考慮到 Siri 和 Apple Intelligence 的畫餅歷史，雷科技對更智能的 Siri 始終持懷疑態度。而這次蘋果與Google的合作，至少說明了一件事——蘋果已經不再堅持「凡事都要自己來」了。Siri 也曾是先進技術的代表不過話又說回來，儘管國內使用者對 Siri 評價非常一般，但作為手機智能助手裡的「老資歷」，Siri 的誕生其實一點都不保守：2011 年，Siri 隨 iPhone 4S 正式發佈，是業內第一批被大規模推向消費級市場的語音助手。要知道在當時，語音互動還停留在指令式輸入的階段，Siri 已經開始嘗試提供語言理解、上下文關聯和服務整合。至少在那個階段，Siri 的出現是具備明顯前瞻性的。但問題在於，作為蘋果的技術產品，Siri 的發展路徑從一開始就被框在了一個保守的技術邊界內。蘋果很早就為 Siri 定下了幾個不容妥協的前提：優先保護隱私、儘可能在端側完成計算、系統行為高度可控。在傳統功能型語音助手時代，這套邏輯是成立的。因為當時的 Siri，本質上只是一個「語音入口」，負責把使用者指令轉譯成系統操作；但當 AI 進入大模型時代，更複雜的 AI 指令帶來了更大的算力缺口，Siri 也開始變得力不從心起來。與 AI 時代脫節不是「一日之寒」在雷科技看來，這種頂層路線的不合時宜，才是 Siri 在 AI 時代體驗「遙遙落後」的根本原因。首先，Siri 的模型規模與能力註定了它不可能好用。在大模型時代，聰明本身就是一種資源密集型能力。更強的理解力、更自然的對話、更複雜的任務拆解，本質上都依賴大規模模型和持續的雲端算力支援。圖片來源：Apple而蘋果在這件事上，一直保持克制：一方面，蘋果希望把 AI 能力儘量壓到端側，減少資料外流；另一方面，蘋果在自建雲端算力上的節奏，也明顯慢於Google、微軟這樣的雲服務原生廠商。這導致 Siri 背後的模型規模長期受限，能力提升緩慢，而使用者對 AI 的期待，卻在 ChatGPT、Gemini 等產品的推動下迅速被拉高。其次，是組織和人才的問題。過去幾年裡，蘋果 AI 團隊的人員流動並不小。從公開資訊來看，不少原本參與核心模型研發的工程師和管理層，陸續被 OpenAI、Google、Meta 等公司吸納。這種流失並不罕見，但在一個高度依賴長期積累的領域，會直接影響研發節奏。更不用說蘋果內部的保密文化對 AI 人才的限制了。在 AI 時代，任何一個技術突破都能在短時間內形成論文、成為研究人員的光鮮履歷和跳槽時的底氣。但在蘋果的保密文化下，除了極少數頭部負責人有在公眾面前露面的機會，大多數研究員都無法將技術與自己掛鉤。在這樣的文化背景下，蘋果 AI 團隊成員接連出走已成必然。而蘋果與 Google、Meta、OpenAI 等巨頭之間的能力差距，也逐漸消耗了外界對 Apple Intelligence 的耐心。能滿足蘋果條件的 AI 模型並不多當然了，蘋果也嘗試過自救，比如講 Apple Intelligence 接入 ChatGPT。但在雷科技看來，對蘋果來說，與Google合作確實是一個更合適當前局面的選擇。首先，OpenAI 的模型能力很大程度上依賴微軟 Azure 的算力。如果蘋果選擇深度繫結 OpenAI，實際上等於在核心 AI 能力上間接受制於微軟，這顯然不符合蘋果一貫強調的獨立性。而Google不僅擁有 Gemini 這樣的自研模型體系，同時也具備成熟的全球雲基礎設施，以及長期服務 Android 與 Pixel 裝置的經驗。在「如何把大模型穩定地嵌入移動系統」這件事上，Google是少數有實戰經驗的公司之一。圖片來源：Google其次，是多模態能力的契合度。Siri 的下一步顯然不是「更會聊天」，而是要理解螢幕、理解應用狀態、理解使用者正在做什麼。這種高度依賴多模態理解的能力，恰好是 Gemini 的強項之一。從這個角度看，Gemini 並不是來「替代 Siri」，而是成為 Siri 背後的理解層和推理層。當然了，既然是雙方合作，那Google的合作態度也非常重要。根據已披露的資訊，Siri 背後的 Gemini 並非直接運行在Google公有雲上，而是被部署在蘋果自建的私有雲端運算體系中。這意味著蘋果依然可以控制資料路徑，維持其隱私敘事。而像 Gemini 這樣同時滿足「模型能力」「雲算力」「隱私控制」這三點的合作方，確實不多。Gemini 能讓蘋果回到 AI 一線嗎？從能力上看，Gemini 的引入，確實有機會補上 Siri 在理解力和執行力上的短板。更複雜的指令拆解、更自然的上下文延續、更穩定的跨應用操作，都是現階段 Siri 明顯欠缺的能力。但這能否把 Siri 重新帶回 AI 助手的第一梯隊，雷科技認為 Gemini 的「藥效」還沒有這麼強。我們知道，AI 能力並不只取決於模型本身，「感知權限」同樣重要。如果蘋果想讓 Siri 重回一線，必然需要在系統層級，真正放權給 Siri。過去 Siri 的很多問題，並不是「不聰明」，而是「不能做」：權限受限、介面不開放、應用不配合，都會直接限制 AI 助手的實際價值。而對國內使用者來說，蘋果與Google的合作也讓 Apple Intelligence 國內落地的情況變得更複雜：Gemini 的引入，必然能為 Siri 帶來質變的提升；但海外模型國內落地的合規性依舊是一道無法繞過的門檻。在這個時間點切換模型，很可能會讓 Apple Intelligence 的入華工作清零。幸運的是，這種不確定性也為國內 AI 廠商創造了機會。圖片來源：豆包如果蘋果證明了一件事——系統級 AI 助手，必須依託頂級模型能力，那麼Android陣營的硬體廠商，也勢必會加快與頭部模型廠商的深度合作。無論是字節、阿里，還是其他大模型團隊，都會迎來新的談判空間。說到底，Siri 和 Gemini 的合作，其實也是蘋果在 AI 時代的一次路線修正。蘋果用直白的技術代差，證明了「有些事情自己真不一定能做」。說到底，iOS 27 能否真正補上那塊畫了三年的 AI 大餅，這個問題沒人說得準。但至少在 2026 年，蘋果終於站到了正確的道路上了。 (雷科技)

蘋果把Siri推向對話式AI：iPhone與Mac將內建聊天介面，背後是與Gemini的深度繫結

一、蘋果這次想改的，不只是Siri的“腦子”過去幾年，Siri的問題從來不止“回答不夠聰明”。更根本的是，它的互動方式已經落後於人們對AI的最新想像：你對它說一句，它回一句；你換個問法，它往往又像“忘了上文”。在ChatGPT把“可以追問、可以糾錯、可以把對話串起來”變成常識之後，傳統語音助手那套“一問一答”的節奏，顯得越來越像上一個時代的產品。Bloomberg 的描述很明確：蘋果要把Siri做成公司的第一款“AI聊天機器人”，並且會嵌入iPhone與Mac等系統裡，成為更像“入口”的能力。Reuters 的轉述也提到，新形態會支援語音與文字兩種模式，並替換現有介面。換句話說，蘋果這次要動的不是某個功能點，而是Siri的“呈現方式”——它不再只是你偶爾叫一聲的語音開關，而更像一個隨時能對話的系統層服務。這種變化的價值，並不在“能不能寫一段更像樣的文字”，而在於它能否讓使用者形成新的習慣：當你要查資訊、寫東西、整理日程、甚至只是想把一句話改得順一點時，你第一反應不是打開一個應用，而是直接跟系統聊。這才是所謂“入口級改造”的真實含義。二、代號“Campos”，要“內建”而不是單單獨的App多家轉述都提到，這個新Siri在蘋果內部的代號是“Campos”，並且它會“嵌得很深”：覆蓋iPhone、iPad與Mac的系統層，而不是以獨立App的形式出現。這點很“蘋果”。在AI時代，最容易做的是再造一個聊天應用——下載、註冊、開聊；但最難的，是把它變成系統能力：隨時可呼出、跨應用協作、能在合適的時機出現、又不把使用者體驗弄得支離破碎。蘋果歷來擅長做後者：它不一定總是第一個做出新東西的人，但往往能把某種能力“系統化”，讓它變成每台裝置都默認擁有的基礎設施。如果Campos真的取代現有Siri介面，這意味著蘋果準備把對話式AI放到一個更醒目的位置——它不再只是“語音助手升級版”，而是“系統互動的一種新形態”。這也解釋了為什麼報導會強調它將成為iOS 27、iPadOS 27和macOS 27的關鍵賣點：當聊天入口成為系統能力，更新系統就不只是“修修補補”，而是一次新的互動敘事。三、或在今年WWDC露面，是“一次性全給”還是“分批交付”？關於節奏，市場最關心的其實不是“會不會做”，而是“什麼時候能用、首發能做到什麼程度”。目前的說法大體一致：蘋果可能在6月的WWDC把這件事擺上檯面，隨後進入測試，最終在秋季隨新系統推送到使用者手裡。但時間線之外，還有一個更敏感的問題：這次會不會再出現“發佈很驚豔，落地很分批”的情況。過去一年，蘋果在“Apple Intelligence”的推進上，就出現過功能分階段上線、體驗逐步補齊的節奏爭議——使用者當然能理解大工程需要迭代，但當AI競爭的窗口期被拉得越來越短，“先講願景、後慢慢交付”就會讓口碑非常被動。Reuters 的描述提到，蘋果在2024年推出Apple Intelligence後，市場反應並不算熱烈，這也讓這次Siri重做承擔了更強的“翻身”期待。所以，iOS 27 的Campos若真要成為“主角”，它必須在兩個維度上過關：一是穩定性與速度——不能像某些第三方聊天應用那樣“偶爾聰明、偶爾胡來”；二是可用性——首發就要讓使用者感到“這東西真的能常用”，而不是只適合演示。否則，Siri的重做就會變成一次昂貴的試錯。四、為什麼是現在：Apple Intelligence的冷場與外部壓力蘋果顯然意識到，Siri已經不能再靠“小修小補”拖下去。對外界而言，Siri的象徵意義太強：它曾經是智能助手浪潮的代表，但在生成式AI時代卻變成“落後”的代名詞。只要Siri還停留在舊範式，外界就會不斷把蘋果與OpenAI、Google做對比——這種對比，那怕不完全公平，也會真實影響使用者預期。更現實的壓力在於：AI正在把“系統入口”重新洗牌。過去，使用者習慣用搜尋、用App、用語音助手；現在，越來越多人習慣先問一個聊天機器人。對蘋果來說，這種習慣遷移一旦固化，意味著它在iPhone與Mac上的“系統入口優勢”會被稀釋——你依然買蘋果硬體，但你的資訊入口、生產力入口可能越來越不在蘋果的體系裡。從這個角度看，Campos不是“追熱點”，而是“止損”。它要做的事，是把使用者從第三方對話入口拉回系統層，讓Siri重新具備存在感。只不過，蘋果這次面對的不是一個簡單的功能差距，而是一種新的互動標準：對話要更連貫、更能理解上下文、更能處理複雜指令。想追上這套標準，靠傳統Siri那種規則+檢索的體系很難完成，必須借助更強的模型能力。五、借Gemini追速度，蘋果要守住的是邊界這就把問題引向報導中最“關鍵的一句”：新Siri背後將深度使用Google的Gemini。Reuters 與 The Verge 的轉述都提到，蘋果與Google的合作將為這次升級提供支撐，並強調這是一種“定製版”的Gemini能力嵌入系統。從工程角度講，這是一條更務實的路：自己從零訓練一個與ChatGPT、Gemini同等級的大模型，既耗時又燒錢，還要在短期內做出穩定可控的產品體驗，難度極高。與其在“模型能力”上硬拚，蘋果更可能選擇在自己最擅長的地方贏回來：把模型能力變成系統體驗，把對話式AI嵌入到裝置、應用與工作流裡。但“借外腦”也帶來一個繞不過去的邊界問題：蘋果如何繼續維持它長期建立的隱私敘事與控制感。使用者關心的從來不只是“它能不能答對”，還包括“我的資料會不會被拿去訓練、請求會不會被外部看到、那些內容在本地處理、那些必須上雲”。這些問題並不會因為蘋果與Google合作就自動消失，反而會更尖銳。因此，Campos真正的挑戰，可能不在“接入Gemini”本身，而在於“怎麼把外部模型能力裝進蘋果的盒子裡”：體驗要統一、呼叫要克制、邊界要清晰。它既要像聊天機器人那樣好用，又要像系統能力那樣穩定，還要保留蘋果一貫的“可控感”。這三件事缺一件，都會讓這次升級失色。 (視界的剖析)